AnĂ¡lisis de Series Temporales

IOT Analytics

PreparaciĂ³n para analizar los datos. Series temporales

Objetivo

ProyecciĂ³n del consumo energĂ©tico a travĂ©s de series temporales.

Procedimiento

Estudiaremos los datos de consumo energético correspondientes a los años 2007 a 2009 a través de series temporales.

Haremos proyecciĂ³n de futuro para el año 2010 y compararemos los resultados con los datos reales de este Ăºltimo año (serie real).

Plot POA

Vamos a analizar la serie temporal del submedidor 3, aire acondicionado y termo elĂ©ctrico. Vamos a extraer 52 observaciones opr año, esto es igual a una observaciĂ³n diaria. Lunes a las 20h. Años 2007, 2008 y 2009

EvoluciĂ³n mensual del consumo. Años 2007-2009

Vamos a representar la serie por meses para cada submedidor y tambien para la energĂ­a global co granularidad mensual. En este caso, la frecuencia serĂ¡ 12, tenemos una observaciĂ³n por mes para los años 2007,8 y 2009.

Parece que los datos tienen estacionariedad (movimientos que se repiten cada año), esto ocurre para todas las variables.

EvoluciĂ³n diaria del consumo por meses

En este caso, crearemos una serie para cada mes, ya que la frecuencia de los datos no serĂ¡ la misma, al tener cada mes un nĂºmero de dĂ­as diferente.

Mes de Enero

Parece que no existen muchos patrones que nos podrĂ­an ayudar a hacer predicciones, no serĂ­an muy fiables. (grĂ¡fica muelle)

Mes de Febrero

Mes de Marzo

EvoluciĂ³n semanal del consumo. Años 2007-2009

Vamos a representar la serie por meses para cada submedidor y tambien para la energĂ­a global co granularidad mensual. En este caso, la frecuencia serĂ¡ 12, tenemos una observaciĂ³n por mes para los años 2007,8 y 2009.

Muelle

Forecasting antes de descomponer la serie

Vamos a plicar regresiĂ³n lineal a cada serie temporal, y veremos el valor de \(R^2\) y del error cuadrĂ¡tico medio.

EvoluciĂ³n mensual del consumo. Años 2007-2009

Modelo


Call:
tslm(formula = tsSM3_070809weekly ~ trend + season)

Residuals:
     Min       1Q   Median       3Q      Max 
-14.0000  -5.1012  -0.3333   1.2321  20.5654 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) 10.10900    4.09735   2.467   0.0152 *
trend       -0.01087    0.01462  -0.744   0.4586  
season2     -3.52184    6.01621  -0.585   0.5596  
season3     -3.84430    6.01534  -0.639   0.5242  
season4     -9.50009    6.01451  -1.580   0.1173  
season5     -3.82255    6.01371  -0.636   0.5264  
season6      2.18832    6.01294   0.364   0.7166  
season7     -4.13414    6.01222  -0.688   0.4932  
season8     -9.45660    6.01152  -1.573   0.1187  
season9     -3.77906    6.01086  -0.629   0.5309  
season10    -3.76818    6.01024  -0.627   0.5321  
season11     1.90936    6.00966   0.318   0.7513  
season12    -3.41310    6.00910  -0.568   0.5713  
season13    -9.40223    6.00859  -1.565   0.1207  
season14    -9.39136    6.00811  -1.563   0.1211  
season15    -3.04715    6.00766  -0.507   0.6131  
 [ reached getOption("max.print") -- omitted 37 rows ]
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 7.863 on 104 degrees of freedom
Multiple R-squared:  0.2639,    Adjusted R-squared:  -0.1042 
F-statistic: 0.7169 on 52 and 104 DF,  p-value: 0.9077

Resultados:

  • Valor del coeficiente de determinaciĂ³n: 0.2639. Es un valor muy bajo, el modelo Ăºnicamente explica el 28% de la variabilidad total.

  • No hay coeficientes significativamente no nulos (p.valores > 0.05). El modelo los supone todos nulos (significativamente)

PredicciĂ³n IC

PredicciĂ³n para los prĂ³ximos 20 dĂ­as

HabĂ­a predicciones negativas, esto es muy grave. No puede haber un consumo negativo de energĂ­a.

EvoluciĂ³n diaria del consumo por meses

Modelo


Call:
tslm(formula = tsSM3_DiariaEnero ~ trend + season)

Residuals:
    Min      1Q  Median      3Q     Max 
-5223.2 -1643.5  -128.2  1968.5  6090.7 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 7359.3708  1811.1381   4.063  0.00014 ***
trend         -0.8762    12.5325  -0.070  0.94449    
season2     1941.2095  2497.7856   0.777  0.44006    
season3     -337.9143  2497.8799  -0.135  0.89284    
season4     1701.2952  2498.0371   0.681  0.49842    
season5     2241.8380  2498.2572   0.897  0.37305    
season6     1754.3809  2498.5401   0.702  0.48525    
season7     3264.9237  2498.8858   1.307  0.19627    
season8     5867.7999  2499.2943   2.348  0.02215 *  
season9     2021.6760  2499.7656   0.809  0.42180    
season10    3640.5522  2500.2996   1.456  0.15051    
season11    1613.7617  2500.8963   0.645  0.52117    
season12    2887.3045  2501.5556   1.154  0.25292    
season13    4624.5140  2502.2776   1.848  0.06943 .  
season14    3936.0569  2503.0621   1.572  0.12101    
season15    5955.9331  2503.9090   2.379  0.02052 *  
 [ reached getOption("max.print") -- omitted 16 rows ]
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3059 on 61 degrees of freedom
Multiple R-squared:  0.3269,    Adjusted R-squared:  -0.01514 
F-statistic: 0.9557 on 31 and 61 DF,  p-value: 0.5438

Resultados:

  • Valor del coeficiente de determinaciĂ³n: 0.3269. Es un valor muy bajo, el modelo Ăºnicamente explica el 28% de la variabilidad total.

  • Solo hay tres coeficientes significativamente no nulos

PredicciĂ³n IC

EvoluciĂ³n semanal del consumo. Años 2007-2009

Submetering 1

Modelo

Call:
tslm(formula = tsSM1_Semanal ~ trend + season)

Residuals:
     Min       1Q   Median       3Q      Max 
-12556.7  -3075.5    452.3   3244.5  13131.7 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 11293.953   1296.107   8.714 4.86e-15 ***
trend         -13.918      9.022  -1.543    0.125    
season2      1125.309   1539.275   0.731    0.466    
season3      2473.662   1539.355   1.607    0.110    
season4       604.928   1539.487   0.393    0.695    
season5       604.933   1539.672   0.393    0.695    
season6      1954.938   1556.701   1.256    0.211    
season7      2171.311   1556.805   1.395    0.165    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 5220 on 151 degrees of freedom
Multiple R-squared:  0.04277,   Adjusted R-squared:  -0.001608 
F-statistic: 0.9638 on 7 and 151 DF,  p-value: 0.4599

Resultados:

  • Valor del coeficiente de determinaciĂ³n: 0.04277. Es un valor extremadamente bajo, el modelo Ăºnicamente explica el 4.8% de la variabilidad total. Las predicciones no serĂ¡n nada fiables

  • Solo hay un coeficiente significativamente no nulo

PredicciĂ³n IC

Predicciones nada fiables, ademĂ¡s de los gigantes IC

Submetering 2

Modelo

Call:
tslm(formula = tsSM2_Semanal ~ trend + season)

Residuals:
     Min       1Q   Median       3Q      Max 
-15279.4  -3018.2     96.8   2999.8  14649.7 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 15204.325   1331.850  11.416  < 2e-16 ***
trend         -49.469      9.271  -5.336 3.42e-07 ***
season2      1470.295   1581.724   0.930   0.3541    
season3      2006.634   1581.805   1.269   0.2065    
season4      1823.016   1581.941   1.152   0.2510    
season5      3049.441   1582.131   1.927   0.0558 .  
season6      3348.419   1599.630   2.093   0.0380 *  
season7      2632.843   1599.737   1.646   0.1019    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 5364 on 151 degrees of freedom
Multiple R-squared:  0.1839,    Adjusted R-squared:  0.1461 
F-statistic: 4.861 on 7 and 151 DF,  p-value: 5.754e-05

Resultados:

  • Valor del coeficiente de determinaciĂ³n: 0.04866. Es un valor extremadamente bajo, el modelo Ăºnicamente explica el 4.8% de la variabilidad total. Las predicciones no serĂ¡n nada fiables

  • Solo hay dos coeficientes significativamente no nulos

PredicciĂ³n IC

Predicciones nada fiables, ademĂ¡s de los gigantes IC

Submetering 3

Modelo

Call:
tslm(formula = tsSM3_Semanal ~ trend + season)

Residuals:
   Min     1Q Median     3Q    Max 
-53120 -10573   2861  13217  35463 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 52739.86    4526.04  11.653   <2e-16 ***
trend          71.74      31.51   2.277   0.0242 *  
season2       -21.70    5375.19  -0.004   0.9968    
season3      4265.13    5375.46   0.793   0.4288    
season4      3267.22    5375.93   0.608   0.5443    
season5      6682.39    5376.57   1.243   0.2158    
season6      2576.96    5436.04   0.474   0.6361    
season7      3812.99    5436.40   0.701   0.4841    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 18230 on 151 degrees of freedom
Multiple R-squared:  0.04866,   Adjusted R-squared:  0.004555 
F-statistic: 1.103 on 7 and 151 DF,  p-value: 0.3639

Resultados:

  • Valor del coeficiente de determinaciĂ³n: 0.04866. Es un valor extremadamente bajo, el modelo Ăºnicamente explica el 4.8% de la variabilidad total. Las predicciones no serĂ¡n nada fiables

  • Solo hay dos coeficientes significativamente no nulos

PredicciĂ³n IC

Predicciones nada fiables, ademĂ¡s de los gigantes IC

ComparaciĂ³n de los coeficientes de cada modelo

   Submedidor      RMSE      R2
1      Cocina  4860.346 0.04277
2    Lavadero  5333.371 0.18390
3 AC y TermoE 25289.142 0.04866

Forecasting descomponiendo la serie (asĂ­ ok)

Descomponer: quitar tendencia

DescomposiciĂ³n y visualizaciĂ³n

         Length Class  Mode     
x        157    ts     numeric  
seasonal 157    ts     numeric  
trend    157    ts     numeric  
random   157    ts     numeric  
figure    52    -none- numeric  
type       1    -none- character

EvoluciĂ³n semanal del consumo. Años 2007-2009

Submetering 1

         Length Class  Mode     
x        159    ts     numeric  
seasonal 159    ts     numeric  
trend    159    ts     numeric  
random   159    ts     numeric  
figure     7    -none- numeric  
type       1    -none- character

Componente estacional muy fuerte, tendencia no.

Submetering 2

         Length Class  Mode     
x        159    ts     numeric  
seasonal 159    ts     numeric  
trend    159    ts     numeric  
random   159    ts     numeric  
figure     7    -none- numeric  
type       1    -none- character
Submetering 3

         Length Class  Mode     
x        159    ts     numeric  
seasonal 159    ts     numeric  
trend    159    ts     numeric  
random   159    ts     numeric  
figure     7    -none- numeric  
type       1    -none- character

EvoluciĂ³n mensual del consumo. Años 2007-2009

Submetering 1

         Length Class  Mode     
x        36     ts     numeric  
seasonal 36     ts     numeric  
trend    36     ts     numeric  
random   36     ts     numeric  
figure   12     -none- numeric  
type      1     -none- character

Componente estacional muy fuerte, tendencia no.

Submetering 2

         Length Class  Mode     
x        36     ts     numeric  
seasonal 36     ts     numeric  
trend    36     ts     numeric  
random   36     ts     numeric  
figure   12     -none- numeric  
type      1     -none- character
Submetering 3

         Length Class  Mode     
x        36     ts     numeric  
seasonal 36     ts     numeric  
trend    36     ts     numeric  
random   36     ts     numeric  
figure   12     -none- numeric  
type      1     -none- character

EvoluciĂ³n diaria del consumo por meses para los años 2007-2009

Submetering 1

         Length Class  Mode     
x        93     ts     numeric  
seasonal 93     ts     numeric  
trend    93     ts     numeric  
random   93     ts     numeric  
figure   31     -none- numeric  
type      1     -none- character

Tendencia creciente, parece que no hay mucha estacionalidad.

Submetering 2

         Length Class  Mode     
x        93     ts     numeric  
seasonal 93     ts     numeric  
trend    93     ts     numeric  
random   93     ts     numeric  
figure   31     -none- numeric  
type      1     -none- character
Submetering 3

         Length Class  Mode     
x        93     ts     numeric  
seasonal 93     ts     numeric  
trend    93     ts     numeric  
random   93     ts     numeric  
figure   31     -none- numeric  
type      1     -none- character